AI资讯新闻榜单内容搜索-GPT 5

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

5551 点击 2026-05-08 14:06

这11个小技巧，GPT-5.5和Claude 4.7的Token 烧得更值 | 附官方指南

OpenAI 和 Anthropic 几乎在同一时间发布自己的提示词文档，在 OpenAI 官网，从 GPT-4.1 到 GPT 5.5，每次新模型发布都有一份完整的提示词指南，告诉我们怎么用新的模型。

来自主题: AI资讯

9142 点击 2026-05-02 21:45

体验完4月最强的三个模型：跑分涨了，却不说人话了

四月真是如风驰电掣：Anthropic 发布了 Opus 4.7，OpenAI 发布了 GPT 5.5，最后，DeepSeek 更新了暌违已久的 V4。三家公司的发布通稿读起来都差不多：跑分又涨了，上下文更长了，推理更强了，代码能力又创了新高。

来自主题: AI资讯

8171 点击 2026-04-29 09:45

K2.6、GPT 5.5、DS v4 扎堆上线了。评测看完也白看，群聊里倒是吵翻了。

花了2天时间，在Moxt上搓了一个免费产品出来，叫烤模。产品地址 bestmodel.cc。在烤模上，你能看到每个模型过去48小时里，真实用户在各个平台说了些什么。惊艳的案例、好评、差评、口碑走势、关键节点、多维度评分，全都有。

来自主题: AI资讯

7471 点击 2026-04-28 16:44

状态页48条事故、累计崩超20小时！Claude三月「宕机成瘾」，$200 Max用户一小时撞限额，开发者怒退订转投Codex

三月的Claude，不是在崩，就是在去崩的路上。状态页48条incident、major/critical事故窗口累计超44小时——这还是保守算法。更离谱的是，$200/月的Max顶配用户反映一小时不到就被限流，项目做到一半突然断供，零预警。推特上「60秒退订教程」疯传，开发者成群结队涌向Codex+GPT 5.4。但逃到对岸就安全了吗？OpenAI状态页显示：Codex三月也崩了7个小时。

来自主题: AI资讯

8269 点击 2026-03-31 10:29